跳到主要内容

C 19-25 编译及预编译

19 编译过程简介

初识编译器

你不知道的事......

预编译

  • 处理所有的注释,以空格代替
  • 将所有的#define删除,并展开所有的宏定义
  • 处理条件编译指令#if,#ifdef,#elif,#else,#endif
  • 处理#include,展开被包含的文件
  • 保留编译器需要使用的#pragma指令

预处理指令示例:gcc -E file.c -o file.i

编译

  • 对预处理文件进行词法分析,语法分析和语义分析
    • 词法分析:分析关键字,标示符,立即数等是否合法
    • 语法分析:分析表达式是否遵循语法规则
    • 语义分析:在语法分析的基础上进一步分析表达式是否合法
  • 分析结束后进行代码优化生成相应的汇编代码文件

编译指令示例:gcc -S file.i -o file.s

汇编

  • 汇编器将汇编代码转变为机器的可以执行命令
  • 每条汇编语句几乎都对应一条机器指令

汇编指令示例:gcc -c file.s -o file.o

编程实验

  • 源码单步编译示例

/*

This is a header file.

*/


char* p = "Hello";

int i = 0;

#include "19-1.h"

// Begin to define macro

#define GREETING "Hello world!"

#define INC(x) x++

// End

int main() {
p = GREETING;
INC(i);
return 0;
}

小结

  • 编译过程分为预处理,编译,汇编和链接四个阶段
    • 预处理:处理注释,宏以及已经以#开头的符号
    • 编译:进行词法分析,语法分析和语义分析等
    • 汇编:将汇编代码翻译为机器指令的目标文件

20 链接过程简介

问题:工程中的每个C语言源文件被编译后产生目标文件,这些目标文件如何生成最终的可执行程序?

链接器的主要作用是把各个模块之间相互引用的部分处理好,使得各个模块之间能够正确的衔接。

静态链接

  • 由编译器在链接时将库的内容直接加入到可执行程序中

Linux下静态库的创建和使用

  • 编译静态库源码:gcc -c lib.c -o lib.o
  • 生成静态库文件:ar -q lib.a lib.o
  • 使用静态库编译:gcc main.c lib.a -o main.out

编程实验

  • 静态链接示例

//slib.c
char* name()
{
return "Static Lib";
}


int add(int a, int b) {
return a + b;
}
#include <stdio.h>

extern char* name();
extern int add(int a, int b);

int main() {
printf("Name: %s\n", name());
printf("Result: %d\n", add(2, 3));

return 0;
}

动态链接

可执行程序在运行时才动态加载库进行链接;库的内容不会进入可执行程序中

Linux下动态库的创建和使用

  • 编译动态库源码:gcc -shared dlib.c -o dlib.so
  • 使用动态库编译:gcc main.c -ldl -o main.out
  • 关键系统调用
    • dlopen:打开动态库文件
    • dlsym:查找动态库中的函数并返回调用地址
    • dlclose:关闭动态库文件

编程实验

  • 动态链接示例
//dlib.c

char* name() {
return "Dynamic Lib";
}


int add(int a, int b) {
return a + b;
}
#include <stdio.h>
#include <dlfcn.h>

int main() {
void* pdlib = dlopen("./dlib.so", RTLD_LAZY);

char* (*pname)();
int (*padd)(int, int);

if( pdlib != NULL ) {
pname = dlsym(pdlib, "name");
padd = dlsym(pdlib, "add");

if( (pname != NULL) && (padd != NULL) )
{
printf("Name: %s\n", pname());
printf("Result: %d\n", padd(2, 3));
}

dlclose(pdlib);
} else {
printf("Cannot open lib ...\n");
}
return 0;
}

小结

  • 链接是将目标文件最终链接为可执行程序
  • 根据链接方式的不同,链接过程可以分为:
    • 静态链接:目标文件直接链接进入可执行程序
    • 动态链接:在程序启动后才动态加载目标文件

21 宏定义与使用分析

#define是预处理器处理的单元实体之一;#define定义的宏可以出现在程序的任意位置;#define定义之后的代码都可以使用这个宏;#define定义的宏常量可以直接使用;#define定义的宏常量本质为字面量。

下面的宏常量定义正确吗?

#define ERROR -1
#define PATH1 "D:\test\test.c"
#define PATH2 D:\test\test.c
#define PATH3 D:\test\
test.c

实例分析

  • 宏定义分析

#define ERROR -1
#define PATH1 "D:\test\test.c"
#define PATH2 D:\test\test.c
#define PATH3 D:\test\
test.c

int main()
{
int err = ERROR;
char* p1 = PATH1;
char* p2 = PATH2;
char* p3 = PATH3;
}

  • #define表达式的使用类似函数调用
  • #define表达式可以比函数更强大
  • #define表达式比函数更容易出错

下面的宏表达式定义正确吗?

#define _SUM_(a,b) (a)+(b)
#define _MIN_(a,b) ((a)<(b)?(a):(b))
#define _DIM_(a) sizeof(a)/sizeof(*a)

实例分析

  • 宏表达式分析
// #include <stdio.h>

#define _SUM_(a, b) (a) + (b)
#define _MIN_(a, b) ((a) < (b) ? (a) : (b))
#define _DIM_(a) sizeof(a)/sizeof(*a)


int main()
{
int a = 1;
int b = 2;
int c[4] = {0};

int s1 = _SUM_(a, b);
int s2 = _SUM_(a, b) * _SUM_(a, b);
int m = _MIN_(a++, b);
int d = _DIM_(c);

// printf("s1 = %d\n", s1);
// printf("s2 = %d\n", s2);
// printf("m = %d\n", m);
// printf("d = %d\n", d);

return 0;
}
  • 宏表达式被预处理器处理,编译器不知道宏表达式的存在
  • 宏表达式用“实参”完全替代形参,不进行任何运算
  • 宏表达式没有任何的“调用开销”
  • 宏表达式中不能出现递归定义
#define _SUM_(n) ((n>0)?(_SUM(n-1)+n):0)
int s = _SUM_(10);

宏定义的常量表达式是否有作用域限制?

下面的程序合法吗?

void def(){
#define PI 3.1415926
#define AREA(r) r*r*PI
}
double area(double r){
return AREA(r);
}

实例分析:宏的作用域分析

// #include <stdio.h>

void def()
{
#define PI 3.1415926
#define AREA(r) r * r * PI
}

double area(double r)
{
return AREA(r);
}

int main()
{
double r = area(5);

// printf("PI = %f\n", PI);
// printf("d = 5; a = %f\n", r);

return 0;
}

强大的内置宏

含义示例
_FILE_被编译的文件名file1.c
_LINE_当前行号25
_DATE_编译时的日期Jan 31 2012
_TIME_编译时的时间17:01:01
_STDC_编译器是否遵循标准C规范1

实例分析

  • 宏使用综合示例
#include <stdio.h>
#include <malloc.h>

#define MALLOC(type, x) (type*)malloc(sizeof(type)*x)

#define FREE(p) (free(p), p=NULL)

#define LOG(s) printf("[%s] {%s:%d} %s \n", __DATE__, __FILE__, __LINE__, s)

#define FOREACH(i, m) for(i=0; i<m; i++)
#define BEGIN {
#define END }

int main()
{
int x = 0;
int* p = MALLOC(int, 5);

LOG("Begin to run main code...");

FOREACH(x, 5)
BEGIN
p[x] = x;
END

FOREACH(x, 5)
BEGIN
printf("%d\n", p[x]);
END

FREE(p);

LOG("End");

return 0;
}

小结

  • 预处理器直接对宏进行文本替换
  • 宏使用时的参数不会进行求值和运算
  • 预处理器不会对宏定义进行语法检查
  • 宏定义时出现的语法错误只能被编译器检测
  • 宏定义的效率高于函数调用
  • 宏的使用会带来一定的副作用

22 条件编译使用分析

  • 条件编译的行为类似于C语言中的if...else...
  • 条件编译是预编译器指示命令,用于控制是否编译某段代码
#define C 1
int main(){
#if(C==1)
printf("This is first printf...\n");
#else
printf("This is second printf...\n")
#endif
return 0;
}

实例分析

  • 条件编译初探
// #include <stdio.h>

#define C 1

int main()
{
const char* s;

#if( C == 1 )
s = "This is first printf...\n";
#else
s = "This is second printf...\n";
#endif

// printf("%s", s);

return 0;
}
  • 预编译器根据条件编译指令有选择的删除代码
  • 编译器不知道代码分支的存在
  • if...else...语句在运行期进行分支判断
  • 条件编译指令在预编译期进行分支判断
  • 可以通过命令行定义宏

gcc -Dmacro=value file.c或gcc -Dmacro file.c

编程实验

  • 通过命令行定义宏
//#include <stdio.h>

int main()
{
const char* s;

#ifdef C
s = "This is first printf...\n";
#else
s = "This is second printf...\n";
#endif

//printf("%s", s);

return 0;
}

  • #include的本质是将已经存在的文件内容嵌入到当前文件中

  • #include的间接包含同样会产生嵌入文件内容的操作

问题:间接包含同一个头文件是否会产生编译错误?

实例分析

  • 条件编译的使用
// global.h
#ifndef _GLOBAL_H_
#define _GLOBAL_H_
int global = 10;

#endif

// test.h

#ifndef _TEST_H_
#define _TEST_H_
#include "global.h"const char* NAME = "test.h";char* hello_world(){ return "Hello world!\n";}

#endif
//main.c
// #include <stdio.h>
#include "test.h"
#include "global.h"

int main() {
const char* s = hello_world();
int g = global;

// printf("%s\n", NAME);
// printf("%d\n", g);

return 0;
}
  • 条件编译可以解决头文件重复包含的编译错误
#ifdef _HEADER_FILE_H_
#define _HEADER_FILE_H_
//source code
#endif
  • 条件编译使得我们可以按照不同的条件编译不同的代码段,因为可以产生不同的目标代码
  • #if...#else...#endif被预编译器处理,而if...else...语句被编译器处理,必然被编译进目标代码
  • 实际工程中条件编译主要用于以下两种情况:
    • 不同的产品线共用同一份代码
    • 区分编译产品的调试版和发布版

实例分析

  • 产品线区分及调试代码应用
//product.h
#define DEBUG 1
#define HIGH 1
//main.c
#include <stdio.h>
#include "product.h"

#if DEBUG
#define LOG(s) printf("[%s:%d] %s\n", __FILE__, __LINE__, s)
#else
#define LOG(s) NULL
#endif

#if HIGH
void f()
{
printf("This is the high level product!\n");
}
#else
void f()
{
}
#endif

int main() {
LOG("Enter main() ...");

f();

printf("1. Query Information.\n");
printf("2. Record Information.\n");
printf("3. Delete Information.\n");

#if HIGH
printf("4. High Level Query.\n");
printf("5. Mannul Service.\n");
printf("6. Exit.\n");
#else
printf("4. Exit.\n");
#endif

LOG("Exit main() ...");

return 0;
}

小结

  • 通过编译器命令行能够定义预处理器使用的宏
  • 条件编译可以避免重复包含同一个头文件
  • 条件编译是在工程中可以区别不同产品线的代码
  • 条件编译可以定义产品的发布版和调试版

23#error和#line使用分析

  • #error用于生成一个编译错误消息
  • 用法
#error message

message不需要用双引号包围 #error编译指示字用于自定义程序员特有的编译错误消息;类似的,#warning用于生成编译警告。

  • #error是一种预编译指示字
  • #error可用于提示编译条件是否满足
#idndef __cplusplus
#error This file should be processed with C++ compiler.
#endif

编译过程中的任意错误信息意味着无法生成最终的可执行程序。

实例分析:#error预处理初探

#include <stdio.h>

#ifndef __cplusplus
#error This file should be processed with C++ compiler.
#endif

class CppClass {
private:
int m_value;
public:
CppClass() { }
~CppClass() { }
};

int main() {
return 0;
}

  • #error在条件编译中的应用
#include <stdio.h>

void f() {
#if ( PRODUCT == 1 )
printf("This is a low level product!\n");
#elif ( PRODUCT == 2 )
printf("This is a middle level product!\n");
#elif ( PRODUCT == 3 )
printf("This is a high level product!\n");
#endif
}

int main() {
f();

printf("1. Query Information.\n");
printf("2. Record Information.\n");
printf("3. Delete Information.\n");

#if ( PRODUCT == 1 )
printf("4. Exit.\n");
#elif ( PRODUCT == 2 )
printf("4. High Level Query.\n");
printf("5. Exit.\n");
#elif ( PRODUCT == 3 )
printf("4. High Level Query.\n");
printf("5. Mannul Service.\n");
printf("6. Exit.\n");
#endif

return 0;
}

#line用于强制指定新的行号和编译文件名,并对源程序的代码重新编号,用法:

#line number filename

filename可省略,#line编译指示字的本质是重定义__LINE____FILE__

编程实验

  • #line的使用
#include <stdio.h>

// The code section is written by A.
// Begin
#line 1 "a.c"

// End

// The code section is written by B.
// Begin
#line 1 "b.c"

// End

// The code section is written by Delphi.
// Begin
#line 1 "delphi_tang.c"


int main()
{
printf("%s : %d\n", __FILE__, __LINE__);

printf("%s : %d\n", __FILE__, __LINE__);

return 0;
}

// End

小结

  • #error用于自定义一条编译错误信息
  • #warning用于自定义一条编译警告信息
  • #error和#warning常应用于条件编译的情形
  • #line用于强制指定新的行号和编译文件名

24 #pragma使用分析

  • #pragma用于指示编译器完成一些特定的动作
  • #pragma所定义的很多指示字是编译器特有的
  • #pragma在不同的编译器间是不可移植的
    • 预处理器将忽略它不认识的#pragma指令
    • 不同的编译器可能以不同的方式解释同一条#pragma指令

一般用法:

#pragma parameter

注:不同的parameter参数语法和意义各不相同

#pragma message

  • message参数在大多数的编译器都有相似的实现
  • message参数在编译时输出消息到编译输出窗口中
  • message用于条件编译中可提示代码的版本信息
#if defined(ANDROID20)
#pragma message("Compile Android SDK 2.0...")
#define VERSION "Android 2.0"
#endif

与#error和#warning不同,#pragma message仅仅代表一条编译消息,不代表程序错误。

实例分析:#pragma message使用示例

#include <stdio.h>

#if defined(ANDROID20)
#pragma message("Compile Android SDK 2.0...")
#define VERSION "Android 2.0"
#elif defined(ANDROID23)
#pragma message("Compile Android SDK 2.3...")
#define VERSION "Android 2.3"
#elif defined(ANDROID40)
#pragma message("Compile Android SDK 4.0...")
#define VERSION "Android 4.0"
#else
#error Compile Version is not provided!
#endif

int main()
{
printf("%s\n", VERSION);

return 0;
}

#pragma once

  • #pragma once用于保证头文件只被编译一次
  • #pragma once是编译器相关的,不一定被支持
#ifndef HEADER_FILE_H
#define HEADER_FILE_H
//source code
#endif
#pragma once

上面这两种方式有什么区别?

实例分析:#pragma once使用分析

//global.h
#pragma once

int g_value = 1;

#include <stdio.h>
#include "global.h"
#include "global.h"

int main()
{
printf("g_value = %d\n", g_value);

return 0;
}

#pragma pack

  • 什么是内存对齐?
    • 不同类型的数据在内存中按照一定的规则排列
    • 而不一定是顺序的一个接一个的排列
struct Test1{
char c1;
short s;
char c2;
int i;
};
struct Test2{
char c1;
char 2;
short s;
int i;
};

Test1和Test2所占的内存空间是否相同?

  • 为什么需要内存对齐?
    • CPU对内存的读取不是连续的,而是分成块读取的,块的大小只能是1、2、4、8、16...字节
    • 当读取操作的数据未对齐,则需要两次总线周期来访问内存,因此性能会大打折扣
    • 某些硬件平台只能从规定的相对地址处读取特定类型的数据,否则产生硬件异常
  • #pragma pack用于指定内存对齐方式
  • #pramga pack能够改变编译器的默认对齐方式
#pragma pack(1)
struct Test1{
char c1;
short s;
char c2;
int i;
};
##pragma pack()

#pragma pack(1)
struct Test2{
char c1;
char c2;
short s;
int i;
};
##pragma pack()

//sizeof(struct Test1) = ?
//sizeof(struct Test1) = ?
  • struce占用的内存大小
    • 第一个成员起始于0偏移处
    • 每个成员按其类型大小和pack参数中较小的一个进行对齐
      • 偏移地址必须能被对齐参数整除
      • 结构体成员的大小取其内部长度最大的数据成员作为其大小
    • 结构体总长度必须为所有对齐参数的整数倍

编译器在默认情况下按照4字节对齐。

编程实验

  • 结构体大小计算
#include <stdio.h>

#pragma pack(2)
struct Test1
{
char c1;
short s;
char c2;
int i;
};
#pragma pack()

#pragma pack(4)
struct Test2
{
char c1;
char c2;
short s;
int i;
};
#pragma pack()

int main()
{
printf("sizeof(Test1) = %d\n", sizeof(struct Test1));
printf("sizeof(Test2) = %d\n", sizeof(struct Test2));

return 0;
}

#include <stdio.h>

#pragma pack(8)

struct S1
{
short a;
long b;
};

struct S2
{
char c;
struct S1 d;
double e;
};

#pragma pack()

int main()
{
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));

return 0;
}

小结

  • #pragma用于指示编译器完成一些特定的动作
  • #pragma所定义的很多指示字是编译器特有的
    • #pragma message用于自定义编译消息
    • #pragma once用于保证头文件只被编译一次
    • #pragma pack用于指定内存对齐方式

25 #和##操作符使用分析

  • #操作符用于在预处理期将宏参数转换为字符串
  • #的转换作用是在预处理期完成的,因此只在宏定义中有效
  • 编译器不知道#的转换作用
  • 用法
#define STRING(x) #x
printf("%s\n",STRING(Hello World!));

实例分析

  • #运算符的基本用法
#include <stdio.h>

#define STRING(x) #x

int main()
{

printf("%s\n", STRING(Hello world!));
printf("%s\n", STRING(100));
printf("%s\n", STRING(while));
printf("%s\n", STRING(return));

return 0;
}

  • #运算符的妙用
#include <stdio.h>

#define CALL(f, p) (printf("Call function %s\n", #f), f(p))

int square(int n)
{
return n * n;
}

int func(int x)
{
return x;
}

int main()
{
int result = 0;

result = CALL(square, 4);

printf("result = %d\n", result);

result = CALL(func, 10);

printf("result = %d\n", result);

return 0;
}

##运算符

  • ##运算符用于在预处理期粘贴两个标识符
  • ##的连接作用是在预处理期完成的,因此只在宏定义中有效
  • 编译器不知道##的连接作用
  • 用法
#define CONNECT(a,b)    a##b
int CONNECT(a,1); //int a1;
a1=2;

实例分析

  • ##运算符的基本用法
#include <stdio.h>

#define NAME(n) name##n

int main()
{

int NAME(1);
int NAME(2);

NAME(1) = 1;
NAME(2) = 2;

printf("%d\n", NAME(1));
printf("%d\n", NAME(2));

return 0;
}
  • ##运算符的工程应用
#include <stdio.h>

#define STRUCT(type) typedef struct _tag_##type type;\
struct _tag_##type

STRUCT(Student)
{
char* name;
int id;
};

int main()
{

Student s1;
Student s2;

s1.name = "s1";
s1.id = 0;

s2.name = "s2";
s2.id = 1;

printf("s1.name = %s\n", s1.name);
printf("s1.id = %d\n", s1.id);
printf("s2.name = %s\n", s2.name);
printf("s2.id = %d\n", s2.id);

return 0;
}

小结

  • #运算符用于在预处理期将宏参数转换为字符串
  • ##运算符用于在预处理期粘贴两个标识符
  • 编译器不知道#和##运算符的存在
  • #和##运算符只在宏定义中有效